کاوش الگوهای تکراری پرسود در پایگاه داده های بزرگ

thesis
abstract

داده­کاوی مجموعه اقلام پرسود در پایگاه داده تراکنشی، منجر به شناسایی مجموعه اقلام با بالاترین سودمندی می­شود. گرچه در سال های اخیر الگوریتم­های بسیاری برای این نمونه کار پیشنهاد شده است، اما این الگوریتم­ها، اکثراً، کارائی خود را صرف تولید مجموعه اقلام کاندید برای تولید مجموعه اقلام پرسود می­نمایند. چنانچه پایگاه داده دارای تعداد تراکنش­های بسیار زیاد و یا دارای مجموعه اقلام پرسود خیلی طولانی باشد، تولید مجموعه اقلام کاندید بسیار دشوار و زمان­بر خواهد شد. در این پایان­نامه، به منظور حل مشکل مذکور، الگوریتم جدیدی به نام pup-growth، ارائه شده است. این الگوریتم، کاوش مجموعه اقلام پرسود را به کمک چند راهبرد موثر برای هرس کردن مجموعه اقلام کاندید و استفاده از سیستم های چند هسته­ای انجام می­دهد. در این الگوریتم، اطلاعات مجموعه اقلام در ساختار داده up-tree ذخیره می شود. مجموعه اقلام کاندید، به صورت کارا و تنها با دو اسکن پایگاه داده تولید می­شوند. با استفاده از موازی­سازی، جنگلی از up-tree ها برای ذخیره مجموعه اقلام، ایجاد می شود. این امر موجب می­شود که کارائی الگوریتم در مقایسه با الگوریتم اولیه، وقتی از مجموعه داده واقعی و ساختگی استفاده می شود، بهبود چشمگیری یابد. به طوریکه بهبود بدست آمده به میزان 65% می­باشد. مشاهدات نشان می دهد، هنگامی که تعداد تراکنش­های طولانی، زیاد باشد، الگوریتم ما بسیار کارا است.

similar resources

کاوش الگوهای تکراری در جریان های داده بر اساس مدل پنجره لغزنده

در مسئله کاوش الگوهای تکراری به دنبال مجموعه هایی هستیم که در تعداد قابل توجهی از تراکنش ها (رکوردها) دیده می شوند. کاوش الگوهای تکراری در جریان های داده کاربرد زیادی در صنعت، تجارت و علوم مختلف دارد. به دلیل سرعت زیاد، بی پایان بودن، حجم بالا و ماهیت تغییر کننده محتوای جریان های داده، یافتن الگوهای تکراری در این نوع داده ها مسئله ای چالش برانگیز است. مدل پنجره لغزنده یکی از مدل های محبوب و پرک...

15 صفحه اول

کاوش الگوهای تکرار شونده در جریانهای داده

یافتن دسته داده های تکراری در جریان پیوسته تراکنشها یکی از مسائل حیاتی در کاربردهایی نظیر تحلیل سبد خرید، مانیتورینگ شبکه و پیش‎بینی فروش انبار می باشد. پنجره لغزان یکی از مدلهایی است که به دلیل مدیریت تغییر محتوا، مصرف حافظه محدود و سرعت پردازش کم به شکل گسترده در یافتن دسته داده های تکراری در جریانهای داده استفاده شده است. یک الگوریتم مبتنی بر مدل پنجره ای لغزان به یک ساختمان داده کارا احتیاج...

15 صفحه اول

ارزیابی مدل‎های داده والگوریتم‌ها در پایگاه-های داده اشیاء متحرک

این مقاله با تمرکز روی رویکرد تاریخچه‎ی حرکت در پایگاه‎های داده اشیاء متحرک، به ارزیابی ساختار و مدل داده پرداخته و سپس الگوریتم‎ها به همراه پیچیدگی هر کدام، به طور جداگانه بحث گردیده‎اند. همچنین با معرفی معیارها به عنوان ابزاری مناسب برای مقایسه پایگاه‎های داده اشیاء متحرک، از پرس‎و‎جوها و داده‎های استفاده شده در معیار BerlinMod، برای ارزیابی و انجام تحلیل‎ها استفاده شده است. نهایتاً به ارائه‎ی...

full text

کاوش برخط الگوهای پویای زمانی در داده های جریانی

کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها...

15 صفحه اول

پایگاه های داده شبکه ای بارش

دسترسی به داده‌های عناصر اقلیمی یکی از پیش نیازهای اساسی در هر مطالعه اقلیمی به شمار می­‌آید. در گذشته داده‌های پیمونگاه­های سازمان­‌های  هواشناسی و مؤسسات وابسته به آن مرسوم‌ترین و قابل اعتمادترین داده‌ها برای مطالعات اقلیمی محسوب می‌شد و استفاده از داده‌های بارش پیمونگاه‌ها پارادایم مسلط در بین اقلیم‌شناسان به شمار می‌آمد. اما در دهه‌های اخیر،  ناتوانی‌ها و ایرادات این پارادایم به خصوص در تعم...

full text

الگوریتم های هوشمند تطابق چهره در پایگاه داده های بزرگ

تطابق چهره بصورت خودکار یکی از کارهای چالش برانگیزی است که در دهمه اخیر توجه زیادی را به خود جلب کرده است. الگوریتم های مختلفی برای تطابق چهره وجود دارند. کارایی این الگوریتم ها روی پایگاه داده های مختلف آزمایش شده است. برای اینکه این الگوریتم ها قابل پیاده سازی و استفاده باشند، باید بتوان از آنها روی پایگاه داده های بززگ استفاده کرد. هنگام اجرا روی پایگاه داده های بزرگ علاوه بر کارایی، زمان اج...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده مهندسی برق و الکترونیک

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023